Id | Sentence |
---|---|
1177 | आंतरराष्ट्रीय अणु उर्जा संस्था (इंग्लिशः The International Atomic Energy Agency -IAEA): अणुउर्जेचा वापर शांततामय कारणांसाठी वाढावा आणि लष्करी कारणांसाठी वापर टाळावा यासाठी प्रयत्न करणारी आंतरराष्ट्रीय संस्था आहे. |
7279 | या मुद्रेला “धम्म चक्र ज्ञान” (Teaching of the wheel of the Dhamma) याचे संकेत देणारे चिन्ह म्हणूनही ओळखले जाते. |
8839 | सर्वांत जुने अजूनही टिकलेले छापील पुस्तक Repetición de Amores y Arte de Ajedrez (इंग्लिशमध्ये Repetition of Love and the Art of Playing Chess) स्पेनच्या लुइस रामिरेझ दे लुसेना याने सालामांका येथे प्रसिद्ध केले. |
Id | Sentence |
---|---|
8839 | सर्वांत जुने अजूनही टिकलेले छापील पुस्तक Repetición de Amores y Arte de Ajedrez (इंग्लिशमध्ये Repetition of Love and the Art of Playing Chess) स्पेनच्या लुइस रामिरेझ दे लुसेना याने सालामांका येथे प्रसिद्ध केले. |
8968 | सांतो दॉमिंगो ( स्पॅनिश :Santo Domingo de Guzmán) ही कॅरिबियनमधील डॉमिनिकन प्रजासत्ताक ह्या देशाची राजधानी व सगळ्यात मोठे शहर आहे. |
Most corpora contain snippets of foreign language text. It is interesting to see where such snippets come from. In this subsection we present sample sentences (of more than 40 characters) of the corpus containing the stopwords the, de, and dem
The foreign language stopwords are chosen to identify snippets in English (the), French, Spanish, Italian (de) or German (dem).
select s_id,sentence from sentences where sentence like "% the %" and length(sentence)>40 limit 10;
Please add more stopwords for more languages.
3.2.4.1 Rank for some international stopwords